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基于 纯 Python 的 SKA-RASCIL 中 的 天 线 增益 校准 实现 与 优化 


黎 静 1 曹 忠 1 王 锋 11 邓 辉 1 梅 鳃 1 戴 伟 ? 
1、 广 州 大 学 物理 与 材料 科学 学 院 / 天 体 物理 中 心 ， 广 州 ,510006 
2. 昆明 理工 大 学 云南 省 计算 机 技术 应 用 重点 实验 室 ， 昆明,，650051 


摘要 : 天 线 增益 是 用 来 衡量 天 线 在 指定 方向 接收 和 发 射 信号 能 力 的 参数 。 随 着 平方 
公里 阵列 (Square Kilometre Array, SKA) 建设 的 日 趋 临近 ， 基 于 Python 语言 的 射电 天 文 
仿真 、 校 准 以 及 成 像 软件 库 (Radio Astronomy Simulation, Calibration and Imaging Li 
brary ，RASCIL) 正 在 开发 完善 中 ， 天 线 增益 校准 算法 的 高 性 能 实现 是 其 中 重要 的 组 成 部 
分 。 本 文 基 于 RASCIL antsol 天 线 增益 校准 算法 开发 工作 ， 首 先 讨 论 了 antsol 算 法 的 基本 原 
理 ， 随 后 分 析 说 明了 基于 纯 Python 的 实现 过 程 ， 在 此 基础 上 进一步 讨论 了 Python 语言 中 算 
法 的 优化 方法 。 结 果 表 明 ， 通 过 底层 优化 后 的 antsol 算 法 实现 可 以 达到 非常 高 的 性 能 。 经 
过 优化 的 算法 将 运用 到 SKA 的 增益 数据 校准 实验 中 ， 本 文 所 介绍 的 优化 方法 对 其 它 天 文 软件 
的 开发 有 一 定 的 参考 价值 。 
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研究 热点 ， 而 要 实现 这 些 研究 目标 ， 就 迫切 需要 射电 望远镜 具有 更 高 的 灵敏 度 
和 分 辨 率 。 和 凭借 其 巨大 的 信号 接收 面积 和 干 公里 的 基线 长 度 ， 新 一 代 射电 望 远 
镜 一 平方 公里 阵 〈SKA) 具有 超 高 灵敏 度 、 超 高 分 辨 率 的 特点 。 同 时 ，SKA 将 以 
纳 秒 级 的 采样 频率 工作 ， 这 意味 着 SKA 将 产生 无 比 庞 大 的 观测 数据 量 。 由 于 结合 
了 高 分 辨 率 、 高 动态 范围 、 大 数据 等 一 系列 最 新 的 射电 天 文 技术 ，SKA 将 给 天 文 
学 研究 带 来 革命 性 的 影响 。 高 质量 成 像 是 实现 SKA 科 学 目标 的 关键 ， 高 精度 的 校 
准 是 实现 大 视 场 、 高 动态 范围 成 像 的 前 提 ， 是 将 原始 观测 数据 转变 为 科研 级 数 
据 的 必 经 过 程 。 项 目 组 前 期 在 SKA 基 础 数据 格式 MS 文件 的 生成 ”、 宽 视 场 成 像 算 
法 分 析 方 面 有 了 较为 深入 的 研究 ”“。 针 对 极为 微弱 且 错 综 复杂 的 各 类 系统 与 环 
境 效 应 的 校准 是 困扰 当前 SKA 科 学 研究 的 关键 因素 ， 为 了 进一步 提高 成 像 精 度 ， 
天 线 增益 的 校准 成 为 叹 待 深入 研究 的 工作 。 射 电 干 涉 阵 对 目标 源 进行 观测 获得 
可 见 度 数据 ， 对 这 些 可 见 度数 据 进行 傅 里 叶 逆 变换 ， 可 以 得 到 天 空 亮 度 分 布 图 
“”。 可 见 度数 据 由 天 线 阵 的 相关 嚣 输出， 但 实际 上 电离 层 的 变化 、 温 度 变 
化 、 地 面 接收 、 天 线 阻 蛙 、 各 种 电子 元 件 的 噪声 接收 、 背 景 温 度 等 造成 天 
线 的 相位 误差 和 幅度 误差 “， 导 致 天 线 增益 发 生变 化 ， 对 相关 器 的 输出 数 
据 产生 干扰 ， 严 重 影 响 可 见 度数 据 的 真实 性 。 因 此 ， 为 了 获得 尽 可 能 真实 
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天 衬 亮 度 分 布 图 以 进行 下 一 步 的 天 文 研 究 ， 必 须 对 射电 干涉 阵 的 观测 数 
AS HEE 

HAT, KRAI am Be ER TT i PRE TATRA RE AS HU: FEM 
ROMFAA, TFA AREER AH. ~P “ER” TERA RRHERR AR, BRM 
初始 预 估 值 开始 进行 调整 ， 直 到 图 像 结 果 与 事先 建立 的 参数 模型 (通常 是 一 个 
点 源 模型 ) 匹配 为 止 。 另 一 种 是 在 天 空中 选取 一 个 已 知 的 、 相 对 稳定 的 强 点 源 
进行 专门 的 校准 观测 ”。 

在 过 去 的 儿 十 年 中 ， 针 对 射电 干涉 阵 成 像 存 在 相位 误差 和 幅度 误差 的 
问题 ， 科 学 家 们 给 予 了 相当 大 的 关注 ， 并 在 增益 校准 算法 上 取得 了 一 定 的 
成 功 ”。1974 年 ，Rogers" 等 人 首次 把 闭合 相位 运用 在 其 长 基线 干涉 测量 
(Very Long Baseline Interferometry , VLBI) 的 相位 校准 中 。 后 来 Fort 和 Yee 
中 Readhead 和 Wilkinson 先后 在 Rogers 的 基础 上 进一步 发 展 增益 校准 
算法 。 但 是 这 些 算法 有 比较 大 的 局 限 性 ， 只 对 望远镜 数量 比较 少 的 射电 干 
涉 阵 的 数据 有 效 ， 且 要 求 不 同 基 线 的 信 品 比 相同 。 因 此 Schwab"" 提 出 了 更 
Laban 的 算法 。 随 后 ，Cornwell 和 Wilkinson" "以 及 Thompson 等 也 改进 和 

完善 了 增益 校准 算法 ， 并 分 别 应 用 在 多 望远镜 射电 连接 干涉 仪 ( Multi Telescope Radio 
Linked Interferometer , MTRLI ) 和 甚大 阵 ( Very Large Array , VLA) 的 图 像 数 据 处 理 
中 。 由 于 性 能 和 良好 ,存在 很 多 年 的 antsol 算 法 至 今 仍 在 GMRT ( Giant Metrewave Radio Te 
lescope ) 和 CASA ( Common Astronomy Software Applications ) 使 用 ,是 AlPS 的 默认 算 
法 。 除 了 经 典 “antsol” 算 法 外 , 还 有 一 种 叫 "Stefcal" 的 算法 "” ， 该 算法 在 低频 阵列 ( Low Fr 
equency Array , LOFAR ) 校准 管线 的 几 个 阶段 中 得 到 了 实现 。 

SKA 的 天 线 增益 校准 是 最 终 SKA 获 得 高 动态 范围 成 像 的 关键 工作 之 一 ， 在 基 
于 Python 语 言 的 射电 天 文 仿真 、 校 准 以 及 成 像 软件 库 (RASCIL) 的 开发 完善 过 程 
中 ， 天 线 增益 校准 的 算法 实现 是 其 中 的 一 个 重要 模块 。 本 文 对 利用 Python 语 言 
实现 天 线 增益 校准 算法 开发 工作 进行 了 研究 ， 重 点 分 析 讨 论 了 代码 实现 与 优化 
问题 。 


二 、 天 线 增益 校准 算法 (antsol) 基本 原理 


在 综合 孔径 成 像 中 ， 不 同 天 线 接收 到 的 信号 通过 乘法 电路 和 时 间 平均 电路 
进行 组 合 以 及 输出 。 乘 法 电路 和 时 间 平 均 电路 组 成 相关 器 。 干 涉 阵 的 每 个 相关 
器 的 输出 为 天 线 信 号 和 系统 噪声 的 总 和 。 对 于 天 线 对 p 和 g， 相 关 器 的 输出 为 ; 

Pra = 88 Pu + Em (1) 
pe 表示 由 天 线 p、q 组 成 的 基线 观测 到 的 可 见 度 ， pe, 表示 模型 可 见 度 模 
通常 是 一 个 点 源 模型 ) ，e。 表示 由 天 线 p 和 天 线 q 组 成 的 基线 的 车 加 噪声 ， 
Hg? SY RA EI A. REG GAL IM AT HOSS. EP ERE 
天 线 k， 增 益 可 写成 : 


(2) 
其 中 |g,| 表 示 天 线 接收 信号 的 幅 值 ，9 表示 信号 基于 天 线 的 相位 。 因 此 ，p、4& 
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天 线 对 的 复 增益 为 : 


(3) 


给 定 p” 并且 已 知 模型 可 见 度 p%,， 就 可 以 求解 天 线 复 增益 6,, 。 假 设 天 线 
复 增益 是 独立 的 ， 且 符合 高 斯 概率 密度 函数 〈 这 意味 着 实 部 和 虚 部 是 独立 的 高 
斯 随机 过 程 》， 则 可 以 通过 使 给 定 的 函数 5 最 小 来 估计 g, 。 


pq 


(4) 
其 中 ，m 表示 权 重 值 。 将 S$ 分别 对 复 增益 的 实 部 a? ER 求 偏 导 数 并 令 其 为 


零 ， 合 并 实 部 、 虚 部 : 


(5) 
在 校准 完成 后 ， 可 以 估算 残 差 ，， 为 了 使 得 残 差 尽 可 能 小 ， 一 般 在 校准 时 都 采 


用 多 次 迭代 的 方法 来 提高 校准 的 精度 。 


(6) 


O 三 、 算 法 实现 


如 前 所 述 ，antsol 算 法 已 经 有 多 种 实现 方式 ， 包 括 Fortran 版 本 与 C 版 本 
等 ， 从 编程 实现 角度 来 看 并 不 困难 。 为 了 保持 与 RASCIL 的 目标 一 致 ， 全 部 程序 
采用 纯 Python 开 发 ， 同 时 软件 包 尽 可 能 为 Python 的 常用 软件 包 。 天 线 增益 校准 
的 程序 名 保存 在 rascil 软 件 包 的 processing_components/calibration 下 ， 程 序 
文件 名 为 solver. py， 所 有 的 源 程序 均 可 以 gitlab 上 下 载 。 

SKA 的 软件 设计 规范 要 求 ， 在 桥接 阶段 的 代码 应 采用 Python 语言 开发 。 为 了 
实现 分 布 式 计算 ，SKA-SDHP 的 代码 均 采 用 DASK (https://www. dask. org) 作为 多 
任务 分 布 计算 框架 。Dask 库 可 以 将 计算 扩展 到 多 个 内 核 甚 至 多 个 机 器 。 因 此 在 
天 线 增益 校准 开发 中 只 实现 相应 的 模块 ， 在 模块 内 不 再 使 用 多 任务 并 行 计算 。 
同时 ， 为 确保 代码 的 可 读 性 ， 目 前 阶段 不 考虑 GPU 并 行 。 为 此 ， 在 开发 RASCIL 相 
应 模块 的 过 程 中 ， 为 了 加 快 进度 和 确保 结果 正确 ， 我 们 直接 以 最 早 的 美国 其 大 
阵 的 源 程序 进行 了 改写 ， 这 一 源 程序 采用 的 基础 算法 来 自 于 Thomspon 这 本 经 典 
书籍 的 附录 1”。 


二 看 


相关 


结合 SKA 数 据 处 理 需 要 ， 在 实现 中 综 


是 计算 天 线 增益 ( 见 公式 5〉 ， 第 二 是 计算 残 差 ( 见 公式 6) 。 算 法 实现 


函数 说 明 见 表 1。 


合 考虑 了 天 线 增 益 校 准 主 的 两 个 过 程 ， 


RL 算法 实现 的 相关 阔 数 说 明 


Table 1. The Implementation of the antsol algorithm 


的 


No. Function Name Desctiption 
Solve a gain table by fitting an obser 
1 solve gaintable ; es : 7 a i 
ved visibility to a model visibility 
; ; Solve for the antenna gains, 
solve antenna gains itsubs_sca ; 
2 lar x(antenna2, antennal) = gain (antennal) 
a i : 
conj (gain (antenna2) ) 
3 solve antenna gains itsubs mat | Solve for the antenna gains using full 
rix matrix expressions 
4 solve antenna gains itsubs_ vec | Solve for the antenna gains using full 
tor vector expressions 
: . . . Gain calculation subfunction(matrix ex 
5 gain substitution matrix . . 
pressions), called in function 2. 
. Gain calculation subfunction(scalar ex 
6 gain substitution scalar . ; . 
pressions), called in function 3 
; . . Gain calculation subfunction(vector ex 
7 gain substitution vector j ; 
pressions), called in function 4 
Calculate residual across all baseline 
. . . s of gain for point source equivalent 
8 Solution residual matrix a 
visibilities, the results are expresse 
d in matrix form, called in function 5 
Calculate residual across all baseline 
. : s of gain for point source equivalent 
9 Solution residual vector ae b ae p a 
visibilities, the results are expresse 
d in vector form, called in function 7 


例 ， 

thon} 
等 效 
代码 


受 限 于 篇 幅 ， 我 们 以 一 个 典型 的 solution resudial matrix 函数 的 实现 为 


原始 代码 〈 略 ) 是 标准 的 Fortran 代 码 ， 因 此 简单 地 把 循环 、 


在 法 进行 修改 。 函 数 的 几 个 参数 : 


可 见 度数 组 ，xwt 表 示 点 源 等 效 权重 数组 ， 函 数 返回 的 是 残 值 数 组 f， 


见 表 2。 


gain 表 示 计 算出 的 增益 数组 ，x 表 示 点 源 


表 2.， solution resudial matrix {ths 


Table 2. Code for solution resudial matrix function 


赋值 语句 按 Py 
H 具体 


def solution residual matrix(gain, x, xwt): 


nants, _, nchan, nrec, _ = x. 


shape 


^da BAT 
Sl Pass 


4 residual = numpy. zeros([nchan, nrec, nrec]) 
5 sumwt = numpy. zeros([nchan, nrec, nrec]) 
6 
: # 以 下 代码 开始 残 值 的 计算 
8 for antl in range(nants): # 第 一 层 循环 ， 天 线 
9 for ant2 in range (nants): # 第 二 层 循环 :天线 
10 for chan in range(nchan): # 第 三 层 循环 : 通道 
11 for recl in range(nrec): 
12 for rec2 in range (nrec) : 
13 error = x[ant2, antl, chan, rec2, recl] - \ 
14 gainlantl, chan, rec2, recl] * numpy. con 
15 jugate(gain[ant2, chan, rec2, recl]) 
residual[chan, rec2, recl] += (error * xwt[ant2, 
16 antl, chan, rec2, recl] * numpy. conjugate (error) ). real 
sumwt [chan, rec2, recl] += xwt[ant2, antl, chan, 
17 rec2, recl] 
18 
19 
20 residual[sumwt > 0.0] = numpy. sqrt (residual[sumwt > 0.0] / sumwt[sum 
91 | wt > 0.0]) 
99 residual [sumwt <= 0.0] = 0.0 
return residual 
以 上 代码 段 中 ， 从 第 8 行 起 五 重 循环 来 实现 不 同 天 线 和 不 同 通道 的 处 理 ， 用 


numpy. conjugate 冰 数 实现 共 斩 函数 。 第 13 行 计算 误差 值 ， 第 16 行 计算 残 差 ， 这 
样 的 代码 风格 与 Fortran 或 C 语 言 程 序 一 致 ， 程 序 易 于 理解 。 在 开发 过 程 中 ， 这 
样 的 代码 也 确保 了 程序 的 快捷 移植 与 实现 ， 结 果 也 符合 预期 。 

但 随 之 而 来 的 问题 是 在 测试 中 发 现 这 些 代 码 运 行 效率 非常 低下 。 通 过 PyCha 
rm 开发 环境 中 的 Profile 功 能 以 及 一 系列 的 实验 ， 我 们 对 代码 性 能 的 瓶颈 进行 了 
分 析 ， 本 质 是 因为 Python 是 解释 型 语言 。 在 编译 型 语言 中 ， 多 重 循环 的 方式 不 
会 影响 整体 性 能 。 但 是 Python 作为 解释 型 脚本 ， 这 样 的 实现 模式 效率 非常 低 
下 。 代 码 13 行 到 18 行 通过 循环 计算 不 同 天 线 和 不 同 通道 数据 的 误差 和 残 差 累加 
和 ， 这 在 Profile 过 程 中 是 耗 时 最 大 的 代码 。 

此 外 ， 虽 然 Python 中 最 有 特色 的 花 式 索引 技术 在 实践 中 利于 编程 ， 如 代码 1 
9 与 20 行 ， 这 在 传统 的 C/C++ 或 Fortran 编 程 中 一 般 是 通过 循环 加 条 件 判 断 来 实 
现 ， 但 性 能 测试 表明 这 种 花 式 索引 技术 在 Python 下 效率 也 不 高 ， 这 一 部 分 是 整 
个 函数 第 二 耗 时 的 地 方 。 


四 、 代 码 优 化 方法 


Python 程 序 代码 性 能 优化 的 方法 有 很 多 ， 但 SKA 项 目 相 关 软 件 规定 采用 纯 Py 
thon 开 发 ， 并 且 要 求 尽量 使 用 Python 常 用 的 软件 包 ， 而 不 建议 采用 过 多 的 第 三 
方 软件 包 。 这 限制 了 利用 C/C++ 开发 再 用 Python 来 调用 。 因 此 ， 针 对 以 上 性 能 低 
下 的 问题 ， 进 一 步 研究 了 Python 代 码 的 优化 以 及 性 能 调 优 问题 。 通 过 对 上 述 代 
码 进行 性 能 分 析 (profile)， 主 要 的 性 能 局 限 在 两 个 方面 ， 一 是 用 代码 实现 的 算 
阵 计 算 ， 二 是 Python 中 的 numpy 所 用 的 花 式 索引 。 


4.1 矩阵 计算 调 优 

仔细 分 析 上 述 代码 ， 结 合 公 式 (5) 和 (6) ， 算 法 实现 的 核心 需求 就 是 实 
现 一 个 天 线 和 对 应 天 线 的 共 力 矩阵 数据 相 乘 。 因 此 要 提高 其 性 能 ， 满 足 SKA 桥 接 
阶段 数据 阶段 的 要 求 ， 就 需要 充分 利用 Python 的 语言 特性 。 

Numpy 是 Python 语言 中 的 重要 软件 包 ， 其 中 提供 了 大 量 的 矩阵 操作 函数 。Nu 
mpy 玉 用 C/C++ 语言 开发 ， 因 此 在 实际 处 理 中 理论 上 性 能 会 远 优 于 纯 脚 本 代码 。N 
umpy 软 件 包 中 提供 了 一 系列 的 数组 或 矩阵 处 理 函 数 ， 包 括 数 组 (和 窍 阵 ) 的 内 
只 、 外 积 等 。 我 们 依次 对 Numpy 所 提供 的 数组 计算 函数 进行 了 性 能 测试 ， 结 果 表 
明 Numpy 软 件 包 上 自 带 的 这 些 函 数 效率 都 远 超 过 Python 脚本 实现 的 效率 。 显 然 ， 优 
化 的 关键 在 于 能 够 一 次 实现 在 第 三 章 出 现 的 多 天 线 、 多 通道 的 数据 处 理 ， 尽 可 
能 避免 Python 中 的 循环 。 

通过 尝试， 最 终 我 们 使 用 了 numpy 中 的 einsum 函 数 。 所 谓 的 einsum ， 全 称 
为 Einstein summation convention 〈 爱 因 斯 坦 求 和 约定 ) ， 又 称 为 爱 因 斯 坦 标 
记 法 ， 是 爱 因 斯 坦 1916 年 提出 的 一 种 标记 约定 。 简 单 来 说 ， 应 用 einsum 孢 是 
省 去 求 和 式 中 的 求 和 符号 。einsum 函 数 的 最 大 优势 是 ， 可 以 把 几 个 多 维 数据 组 
中 的 某 几 个 维度 进行 乘积 或 者 乘积 求 和 。 

对 于 射电 干涉 阵 数 据 人 处理 来 说 ， 一 般 存 在 天 线 〈( 或 者 基线 ) 、 频 率 通道 、 
极 化 等 多 个 维度 ， 用 einsum 可 以 根据 需要 灵活 地 进行 矩阵 计算 ， 如 矩阵 转 置 、 
矩阵 乘法 、 求 迹 、 张 量 乘 法 、 数 组 求 和 等 等 ， 如 果 分 别 用 transopse、sun、tra 
ce、tensordot 等 函数 实现 ， 不 但 复杂 ， 还 容易 出 错 。 此 外 ， 由 于 开发 团队 已 经 
对 einsum 进 行 过 多 次 优化 ， 整 体 来 看 einsum 自 身 性 能 较 好 ， 是 一 个 非常 有 效 的 
方法 。 但 einsum 开 发 的 难度 在 于 开发 者 需要 充分 了 解 其 计算 的 原理 ， 对 数组 中 
的 数据 处 理 过 程 要 有 非常 清楚 的 认识 。 


4.2 花 式 索引 的 优化 方法 

对 一 个 数组 的 部 分 数据 进行 处 理 是 编程 中 常见 的 要 求 ， 在 C/C++ 或 Fortran 
中 ， 一 个 循环 语句 就 可 以 实现 对 数组 中 部 分 数据 的 处 理 ， 并 保持 较 高 的 效率 。 
但 Python 中 ， 由 于 脚本 解释 的 关系 ， 循 环 语句 效率 不 高 。 通 过 对 相关 函数 的 测 
试 ， 最 终 我 们 发 现 ，putmask 函 数 是 当前 Numpy 软 件 包 中 实现 数组 部 分 元 素 蔡 换 
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4.3 最 终 实现 与 性 能 对 比 
经 过 一 系列 改进 ， 在 RASCIL 中 最 终 实现 的 代码 如 表 3 所 示 。 


K 3. 优化 后 的 solution residual matrix 函数 的 代码 


Table 3. Optimized code for the solution residual matrix function 


1 def solution residual matrix(gain, x, xwt): 

2 nants, _, nchan, nrec, _ = x. shape 

3 n residual = numpy. zeros([nchan, nrec, nrec]) 

4 n sumwt = numpy. zeros ([nchan, nrec, nrec]) 

5 

6 n gain = numpy. einsum( i..., j...—-ij...’, numpy. conjugate(gain), ga 
7 in) 

8 n error = numpy. conjugate(x - n gain) 

9 nn residual = (n error * xwt * numpy. conjugate(n error) ). real 

10 n residual = numpy. einsum( ijk...—>k...’, nn residual) 


11 n sumwt = numpy. einsum( ijk...—>k...’, xwt) 
12 
13 numpy. putmask (n residual,n sumwt > 0.0, numpy. sqrt (n residual [n sum 
14 | wt > 0.0] / n sumwt[ln sumwt > 0.0]) 
15 numpy. putmask(n residual, n sumwt <= 0.0, 0. 0) 
return n_residual 
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过 简单 的 求解 就 可 以 获得 误差 〈 见 第 7 行 ) 。 atl aie E 9 和 10 
行 ， 直 接 将 各 个 天 线 的 可 见 度 数据 一 次 处 理 完 。 整 个 功能 实现 与 表 2 的 完全 一 
致 。 同 时 ， 程 序 13 与 14 行 采用 putmask 函 数 来 奉 换 之 前 的 花 式 索引 。 


五 、 性 能 分 析 与 讨论 


经 过 多 次 优化 和 完善 代码 ， 优 化 后 的 程序 计算 性 能 得 到 了 明显 的 提高 。 我 
们 在 服务 器 (CentOS 7. 8 操作 系统 ，Intel E5 2620 V4 CPU 和 128G 内 存 ) 的 环 
境 中 ， 完 成 仿真 了 SKA1-LOW 的 可 见 度 函数 ， 进 而 利用 可 见 度 函数 对 计算 耗 时 进 
行 了 测试 。 

表 4 列 出 了 优化 前 后 的 计算 耗 时 对 比 ， 优 化 前 耗 时 即 为 原始 代码 的 profile 
结果 ， 优 化 后 耗 时 即 为 对 矩阵 计算 和 花 式 索 引进 行 优 化 后 的 profile 结 果 。 其 中 
gain substitution matrix 浮 数 加 速 比 大 约 达到 100、Solution residual matr 
ix 隙 数 加 速 比 约 为 250、Solution residual vector 加速 比 约 为 500。 优 化 后 的 
代码 满足 了 SKA 桥 接 阶 段 的 性 能 求 。 通 过 优化 前 后 代码 的 性 能 对 比 ， 我 们 对 Py 
thon 语 言 天 文 软件 的 开发 有 了 更 多 的 理解 。 

(1) 不 要 依赖 传统 的 C/C++ 或 Fortran 的 编程 基础 来 开发 Python 代码 ， 而 是 
从 C-Style 或 者 Fortran-Style 编 程 转变 到 真正 的 Python-Style。 

(2) 要 深入 分 析 代 码 的 实现 模式 ， 尽 可 能 应 用 Numpy 中 的 内 置 函数 。 同 时 N 
umpy 不 同 函 数 的 性 能 有 差异 ， 在 对 性 能 有 需求 的 情况 下 需要 事先 对 不 同 函 数 进 
行 测试 。 

(3) Numpy 是 纯 C/C++ 开 发 ， 因 为 在 理想 情况 下 ，Python 开 发 的 代码 也 会 与 
C/C++ 实现 代码 基本 性 能 相当 。 由 于 受到 SKA 目 前 阶段 代码 开发 规范 的 限制 ， 本 
文 没有 讨论 直接 用 C/C++ 实现 ， 或 者 使 用 Numba 进 行 实时 编译 。 但 本 文 的 结果 表 
明 ， 经 过 优化 的 Python 代码 也 能 达到 与 C/C++ 相 当 的 性 能 ， 既 满足 了 性 能 的 要 
求 ， 又 保持 了 程序 代码 的 可 读 性 。 

(4) 本 文 没有 将 Python 实 现 的 代码 与 传统 的 Fortran 或 C/C++ 实现 的 代码 进 
行 对 比 ， B BERDA IA AE E RODIE T fE 一 般 来 说 ，C/C++ 的 代码 


会 比 Python 程 序 有 几 十 甚至 上 百倍 的 效率 提升 。 但 从 本 文 的 优化 效果 来 看 ， 优 
化 后 的 计算 耗 时 也 与 纯 C/C++ 代 码 基本 相当 。 


RA. 优化 前 后 计算 耗 时 对 比 


Table 4. The time consumption comparison between and after optimization 


X 


=a 
T=? 


Time consumption Time consumption 
No. Function Name before optimization after optimization 
(ms) (ms) 
1 gain_substitution_matrix 12630 121 
2 gain_substitution_scalar 947 66 
3 gain_substitution_vector 18083 489 


4 Solution_residual_matrix 5940 24 


5 Solution_residual_ vector 11433 23 
六 、 BEY 
Sy tie) pat SARS a i 基本 原 理 以 及 标准 C/C++ 或 Fort 


ran 代 码 的 移植 过 程 ， 然 后 针对 Python 代 码 中 的 算法 实现 提出 了 了 优化 方法 。 最 后 
对 优化 前 后 的 算法 耗 时 进行 试验 和 比较 。 代 码 实现 结果 表明 ， e ith 
的 Python 算法 可 以 达到 与 传统 Fortran 语 言 实现 fant sol SE: 相近 的 性 能 。 经 过 
优化 的 算法 将 运用 到 SKA 的 增益 数据 实验 中 ， 本 文 所 介绍 的 优化 方法 对 其 它 天 文 
软件 的 开发 有 一 定 的 参考 价值 。 
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Abstract: Antenna gain is a parameter that measures the ability of an 
antenna to receive and transmit signals in a specified direction. Wit 
h the construction of the Square Kilometre Array (SKA), the Python-ba 
sed radio astronomy simulation, calibration and imaging software libr 
ary (RASCIL) is being developed and improved, and the high-performanc 
e implementation of the algorithm in antenna gain calibration is an i 
mportant part of it. Based on the development of the RASCIL antsol an 
tenna gain calibration algorithm undertaken, this study first discuss 
es the basic principles of the antsol algorithm, and then analyzes th 
e implementation process based on pure Python scripts, and further di 
scusses the optimization method of the algorithm in the Python langua 
ge on this basis. The result shows that the implementation of the opt 
imized antsol algorithm can achieve very high performance. The optimi 
zed algorithm will be used in the gain data calibration experiment of 
SKA. The optimization method introduced in this paper has certain ref 
erence value for the development of other astronomical softwares. 
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